¿Qué son los datos en el sistema? ¿Cuáles son los 5 componentes de un sistema de información? ¿Qué es un sistema de base de datos y ejemplos?
Introducción a los Sistemas de Datos
El sistema objeto puede tratarse de personas, cosas, procedimientos, documentos, etc. De éstos se obtienen datos que ingresan al SI para ser almacenados y procesados, para luego convertirse en información. Para realizar un
Si mediante un sistema de datos se necesita comprender cómo símbolos registrados (datos) pueden utilizarse para representar información (conocimiento) acerca del sistema objeto. Para estar en condiciones de entender la realidad (y el sistema objeto), el hombre organiza los objetos y los fenómenos en clases de objetos. Similarmente, las propiedades son organizadas en tipos o clases de propiedades o atributos o relaciones.
Dado que el propósito de los sistemas de datos es proveer información acerca del mundo real, la definición de los datos y del procesamiento a incluir en el sistema debe desarrollarse a partir de las concepciones que los usuarios tengan de sus mundos y no de los requerimientos de los programas de una computadora. Se atiende al diseño de los sistemas de datos antes de comenzar una tarea de construcción detallada. Un SÍ está bien diseñado sólo si provee la información adecuada, en cuanto a su tipo, calidad y oportunidad, y lo hace en una forma económica, lo cual presenta dos problemas:
A partir de estos 5 problemas es que se definen las áreas principales del diseño de los SI:
- Análisis y diseño del sistema objeto.
- Análisis iconológico (la cual puede relacionarse con la capacidad de entender cuáles de los datos externos que posibilita el “big data” son de utilidad).
- Arquitectura del sistema de datos.
- Construcción del sistema de datos.
- Implementación y operación del sistema de datos.
Los sistemas de datos han cobrado mucha importancia, dado que los datos son un activo importante de cada organización, que podrían generarle ventajas competitivas. Los denominados datos abiertos (open data) habilitan a las organizaciones la posibilidad de usar datos externos, que sino serían muy difíciles de conseguir.
El término “Big Data” podría traducirse como datos masivos. requiere también, abordar nuevas problemáticas tecnológicas en la gestión de datos, que se las resume con las tres V: Volumen (cantidad de bytes), Velocidad (tiempo de respuesta) y Variedad (de formatos). También se agrega una cuarta V, que es la veracidad, ya que es un desafío verificar la confiabilidad de los datos (sobre todo cuando provienen de diversas fuentes y no hay poco tiempo para validar).
Big data y los desafíos de las V
- Volumen
- Velocidad
- Variedad
- Veracidad
Sistemas gestores de bases de datos (SGBD)
Los usuarios finales trabajan con software aplicativo que accede a datos almacenados en el almacenamiento secundario. Entre ambos existe un sistema de gestión de bases de datos (SGBD). Éste consiste en una colección de datos interrelacionados y un conjunto de programas para acceder a dichos datos. La colección de datos, denominada base de datos, contiene información relevante para una empresa. El objetivo principal de un SGBD es proporcionar una forma de almacenar y recuperar la información de una base de datos de manera que sea tanto práctica como eficiente. Se diseñan para gestionar grandes cantidades de información.
Los SGBD se implementan siempre sobre un sistema operativo y brindan servicios que permiten gestionar varios problemas de datos:
- Transacciones: Una transacción es un conjunto de operaciones que lleva a cabo una única función lógica en una aplicación de bases de datos. Cada transacción es una unidad de atomicidad y consistencia. Por tanto, se exige que, si la base de datos era consistente cuando la transacción comenzó, debe ser consistente cuando la transacción termine con éxito. El SGBD garantiza que la base de datos quede en un estado consistente (correcto) a pesar de los fallos del sistema, y que la ejecución concurrente de transacciones transcurra sin conflictos.
- Concurrencia: control de la interacción entre las transacciones concurrentes (2 o más peticiones sobre un mismo objeto) para garantizar la consistencia de la base de datos.
- Acceso: a partir de la gestión de usuarios y contraseñas, se diferencia a los usuarios en cuanto al tipo de acceso que se les permite a diferentes valores de los datos de la base de datos. Estas diferenciaciones se expresan en términos de autorización, las cuales pueden ser de lectura, inserción, actualización y eliminación de los datos.
- Restricciones: un SGBD dispone de elementos que permiten asegurar restricciones en los datos que se carguen en la base de datos. Las restricciones pueden ser:
- De dominio: Se debe asociar un dominio de valores posibles a cada atributo. La declaración de un atributo como parte de un dominio concreto actúa como restricción de los valores que puede adoptar.
- Integridad referencial: asegurar que un valor que aparece en una relación para un conjunto de atributos dado aparece también para un determinado conjunto de atributos en otra relación. Las modificaciones de la base de datos pueden causar violaciones de la integridad referencial. Cuando se viola una restricción de integridad, el procedimiento normal es rechazar la acción que ha causado esa violación.
- Archivos: gestiona la asignación de espacio de almacenamiento de disco y las estructuras de datos usadas para representar la información almacenada en el disco.
- Memoria intermedia: es responsable de traer los datos desde el disco de almacenamiento a la memoria principal y decidir los datos a guardar en la memoria caché. Es una parte fundamental de los sistemas de bases de datos, ya que permite que la ésta maneje tamaños de datos que son mucho mayores que el tamaño de la memoria principal.
- Optimizar consultas: las consultas ayuda al sistema de bases de datos a simplificar y facilitar el acceso a los datos. Por ello, el rápido procesamiento de las actualizaciones y de las consultas es importante.
- Archivos de datos: almacenan la base de datos en sí misma.
- Diccionario de datos: Para poder guardar un dato, éste debe respetar una cierta estructura (tipo de dato, longitud, etc.). Por ello, los SGBD poseen un tipo especial de tabla, denominada diccionario de datos en donde se guarda esta información (metadatos) que hace que la base de datos se defina a sí misma. Antes de leer o modificar los datos reales, el SGBD consulta el diccionario de datos: es decir, provee los metadatos a las instrucciones de lenguaje de manipulación de datos
- (DML). El diccionario de datos sólo puede ser accedido y actualizado por el propio SGBD (no por los usuarios normales).
- Índices: Pueden proporcionar un acceso rápido a los elementos de datos. Facilitan punteros a los elementos de datos que tienen un valor concreto. La asociación es una alternativa a la indexación que es más rápida en algunos casos, pero no en todos.
- Definición del esquema: crea el esquema original de la base de datos mediante la ejecución de un conjunto de instrucciones de definición de datos en el DDL.
- Definición de la estructura y del método de acceso.
- Modificación del esquema y de la organización física: el DBA es el responsable de hacer las modificaciones en el esquema de la base de datos para reflejar las necesidades cambiantes de la organización, o para alterar la organización física a fin de mejorar el rendimiento. Lo hace mediante herramientas que facilitan escribir el lenguaje de definición de datos (DDL).
- Concesión de autorización para el acceso a los datos: puede regular las partes de la base de datos a las que puede tener acceso cada usuario.
- Mantenimiento rutinario:
- Back up periódico para impedir la pérdida de datos en caso de desastres.
- Asegurarse de que se dispone de suficiente espacio libre en disco para las operaciones normales y aumentar el espacio en disco según sea necesario.
- Supervisar los trabajos que se ejecuten en la base de datos y asegurarse de que el rendimiento no se degrade debido a que algún usuario haya remitido tareas muy costosas.
- Nivel conceptual (de vistas, externo):
- Nivel lógico (esquema):
- Nivel físico (interno):
- Diseño conceptual:
- Diseño lógico:
El hecho de que se implemente un SGBD no quita la posibilidad de que exista un software aplicativo por cada proceso de la organización para cargar los datos en la base.
Estructura física
El SGBD implementa varias estructuras de datos como parte de la implementación física del sistema:
Administrador de bases de datos (DBA)
Una de las principales razones de usar SGBD es tener un control centralizado tanto de los datos como de los programas que tienen acceso a esos datos. La persona que tiene ese control central sobre el sistema se denomina administrador de bases de datos (DBA). Las funciones del DBA incluyen:
Los niveles de Abstracción de los datos
Para que el sistema sea útil debe recuperar los datos eficientemente. Esto implica usar estructuras de datos complejas para la representación de los datos. Dado que muchos de los usuarios de sistemas de bases de datos no tienen formación en informática, los desarrolladores ocultan esa complejidad a los usuarios mediante varios niveles de abstracción para simplificar la interacción de los usuarios con el sistema:
nivel más elevado de abstracción. Sólo describe parte de la base de datos. Si bien es el menos complejo, aún queda algo de complejidad debido a la variedad de información almacenada en las grandes bases de datos. Muchos usuarios del sistema no necesitan toda esta información; en su lugar sólo necesitan tener acceso a una parte de la base de datos. El nivel conceptual existe para simplificar su interacción con el sistema. Éste puede proporcionar muchas vistas para la misma base de datos.
El nivel inmediatamente inferior de abstracción describe qué datos se almacenan en la base de datos y qué relaciones existen entre esos datos. Este nivel, por tanto, describe toda la base de datos en términos de un número pequeño de estructuras relativamente simples. Aunque la implementación de esas estructuras simples en el nivel lógico puede involucrar estructuras complejas del nivel físico, los usuarios del nivel lógico no necesitan preocuparse de esta complejidad. Los DBA, que deben decidir la información que se guarda en la base de datos, usan el nivel de abstracción lógico.
El nivel más bajo de abstracción describe cómo se almacenan realmente los datos. Describe en detalle las estructuras de datos complejas de bajo nivel.
Ciclo de vida y diseño
Dentro del ciclo de vida de un sistema de base de datos, en la etapa de diseño se definen cómo se constituirán y funcionarán los distintos niveles de abstracción:
escoger el modelo de datos y traducir requisitos relevados en un esquema conceptual de la base de datos.
Relacionar el esquema conceptual con el modelo de implementación de los datos del sistema de base de datos que se va a usar
Uso del esquema de base de datos específico para el sistema resultante. Se especifican las características físicas de la base de datos (organización de archivos, estructuras de almacenamiento interno, etc.).
Arquitectura de las bases de datos
La arquitectura de los sistemas de bases de datos se ve muy influida por el sistema informático subyacente sobre el que se ejecuta el sistema de bases de datos.
Los sistemas de bases de datos pueden estar:
- Centralizados.
- Tipo cliente-servidor: Hoy en día la mayor parte de los usuarios de los sistemas de bases de datos no está presente en el lugar físico en que se encuentra el sistema de bases de datos, sino que se conectan a él a través de una red. Por tanto, se puede diferenciar entre los sistemas clientes, en los que trabajan los usuarios remotos de la base de datos, y los sistemas servidores, en los que se ejecutan los sistemas de bases de datos.
- Paralelos.
- Distribuidos: se extienden por varias máquinas geográficamente separadas.